Národní úložiště šedé literatury Nalezeno 19 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Extensions to Probabilistic Linear Discriminant Analysis for Speaker Recognition
Plchot, Oldřich ; Fousek, Petr (oponent) ; McCree,, Alan (oponent) ; Burget, Lukáš (vedoucí práce)
This thesis deals with probabilistic models for automatic speaker verification. In particular, the Probabilistic Linear Discriminant Analysis (PLDA) model, which models i--vector representation of speech utterances, is analyzed in detail. The thesis proposes extensions to the standard state-of-the-art PLDA model. The newly proposed Full Posterior Distribution PLDA  models the uncertainty associated with the i--vector generation process. A new discriminative approach to training the speaker verification system based on the~PLDA model is also proposed. When comparing the original PLDA with the model extended by considering the i--vector uncertainty, results obtained with the extended model show up to 20% relative improvement on tests with short segments of speech. As the test segments get longer (more than one minute), the performance gain of the extended model is lower, but it is never worse than the baseline. Training data are, however, usually  available in the form of segments which are sufficiently long and therefore, in such cases, there is no gain from using the extended model  for training. Instead, the training can be performed with the original PLDA model and the extended model can be used if the task is to test on the short segments. The discriminative classifier is based on classifying pairs of i--vectors into two classes representing target and non-target trials. The functional form for obtaining the score for every i--vector pair is derived from the  PLDA model and training is based on the logistic regression minimizing  the cross-entropy error function  between the correct labeling of all trials and the probabilistic labeling proposed by the system. The results obtained with discriminatively trained system are similar to those obtained with generative baseline, but the discriminative approach shows the ability to output better calibrated scores. This property leads to a  better actual verification performance on an unseen evaluation set, which is an important feature for real use scenarios.
Optimization of Gaussian Mixture Subspace Models and Related Scoring Algorithms in Speaker Verification
Glembek, Ondřej ; Brummer, Niko (oponent) ; Campbell,, William (oponent) ; Burget, Lukáš (vedoucí práce)
This thesis deals with Gaussian Mixture Subspace Modeling in automatic speaker recognition. The thesis consists of three parts.  In the first part, Joint Factor Analysis (JFA) scoring methods are studied.  The methods differ mainly in how they deal with the channel of the tested utterance.  The general JFA likelihood function is investigated and the methods are compared both in terms of accuracy and speed.  It was found that linear approximation of the log-likelihood function gives comparable results to the full log-likelihood evaluation while simplyfing the formula and dramatically reducing the computation speed. In the second part, i-vector extraction is studied and two simplification methods are proposed. The motivation for this part was to allow for using the state-of-the-art technique on small scale devices and to setup a simple discriminative-training system.  It is shown that, for long utterances, while sacrificing the accuracy, we can get very fast and compact i-vector systems. On a short-utterance(5-second) task, the results of the simplified systems are comparable to the full i-vector extraction. The third part deals with discriminative training in automatic speaker recognition.  Previous work in the field is summarized and---based on the knowledge from the earlier chapters of this work---discriminative training of the i-vector extractor parameters is proposed.  It is shown that discriminative re-training of the i-vector extractor can improve the system if the initial estimation is computed using the generative approach.
Detekce pohybu v obraze z kamery
Polanský, Petr ; Sochor, Jakub (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je zhodnotit účinnost detekce pohybu pomocí Gaussova rozdělení pravděpodobnosti. Algoritmus při detekci pohybu vytvoří krátké video zachycující pohyb a vhodně jej vizualizuje. Vizualizace je provedena grafem intenzity bílých pixelů mapující pohyb. Systém je vhodný hlavně pro méně rušné oblasti, kde pohyb je významnou změnou prostředí. Výsledky této práce ukazují, jaký vliv na detekci mají okolní podmínky a poloha kamery.
Získávání znalostí z obrazových databází
Jaroš, Ondřej ; Řezníček, Ivo (oponent) ; Chmelař, Petr (vedoucí práce)
Tato diplomová práce je zaměřena na problematiku získávání znalostí z databází, především pak na metody klasifikace a predikce. Tyto metody jsou zde podrobně popsány. Dále se práce zabývá obecně multimediálními databázemi a způsobem, jakým jsou do těchto databází data ukládána. Především jsou tu pak popsány metody pro nízkoúrovňové zpracování obrazových a video dat. V praktické části se diplomová práce zaměřuje na implementaci metody GMM používané pro extrakci nízkoúrovňových rysů z video dat a obrázků. V dalších částech jsou popsána vstupní data a nástroje, se kterými byla implementovaná metoda porovnávána. Poslední část se zaměřuje na experimenty porovnávající účinnost extrakce rysů vysoké úrovně z nízkoúrovňových dat implementované metody a vybraného klasifikačního nástroje LibSVM.
Získávání znalostí z multimediálních databází
Jurčák, Petr ; Řezníček, Ivo (oponent) ; Chmelař, Petr (vedoucí práce)
Práce je věnována tématu problematiky získávání znalostí z databází. Je zaměřena na základní metody klasifikace a predikce pro dolování dat. Dále se práce zaobírá extrakci nízkoúrovňových rysů z video dat a obrázků, a také shrnuje poznatky z podobnostního vyhledávání v multimediálním obsahu a indexaci tohoto typu dat. Závěr je věnován implementaci vybrané klasifikační metody a porovnání dosažených výsledků s nástrojem LibSVM.
Sledování pohybů osob v záznamu ze stacionární kamery
Trnkal, Milan ; Orság, Filip (oponent) ; Goldmann, Tomáš (vedoucí práce)
Tato práce se zaměřuje na problematiku sledování chodců kamerou. Představil jsem používané metody počítačového vidění, které jsou vhodné pro detekci a klasifikaci osob. Na základě detekce pohybu osob ve videozáznamu jsem navrhl algoritmus pro detekci a sledování chodců. Výsledná aplikace používá histogram orientovaných gradientů a SVM klasifikátor, pro identifikaci chodců jsou využity barevné histogramy. Zjištěné trajektorie jsou následně vykreslovány na výstup. V poslední části práce se zabývám testováním a vyhodnocením výsledků navrženého algoritmu.
Dynamic Scene Understanding for Mobile Robot Navigation
Mikšík, Ondřej ; Horák, Karel (oponent) ; Žalud, Luděk (vedoucí práce)
The thesis deals with dynamic scene understanding for mobile robot navigation. In the first part, we propose a novel approach to self-supervised learning - a fusion of frequency based vanishing point estimation and probabilistically based color segmentation. Detection of a vanishing point is based on the estimation of a texture flow produced by a bank of Gabor wavelets and a voting function. Next, the vanishing point defines the training area which is used for self-supervised learning of color models. Finally, road patches are selected by measuring roadness score. A few rules deal with dark cast shadows, overexposed hightlights and adaptivity speed. In addition to that, the whole vanishing point estimation is refined - Gabor filters are approximated by Haar-like box functions, which enables efficient filtering via integral image trick. The tightest bottleneck, a voting scheme, is modified to coarse-to-fine, which provides a significant speed-up (more than 40x), while we loose only 3-5% in precision. The second part proposes a smoothing filter for spatio-temporal consistency of structured predictions, that are useful for more mature systems. The key part of the proposed smoothing filter is a new similarity metric, which is more discriminative than the standard Euclidean distance and can be used for various computer vision tasks. The smoothing filter first estimates optical flow to define a local neighborhood. This neighborhood is used for recursive averaging based on the similarity metric. The total accuracy of proposed method measured on pixels with inconsistent labels between the raw and smooth predictions is almost 18% higher than original predictions. Although we have used SHIM, the algorithm can be combined with any other system for structured predictions (MRF/CRF,...). The proposed smoothing filter represents a first step towards full inference.
Autonomní jednokanálový deinterleaving
Tomešová, Tereza ; Žák, Libor (oponent) ; Hübnerová, Zuzana (vedoucí práce)
Tato práce se zabývá autonomním jednokanálovým deinterleavingem. Autonomní jednokánálový deinterleaving je proces separace přijaté sekvence radiolokačních impulzů od více emiterů na sekvence od jednotlivých emiterů, který jep rováděn bez lidské pomoci. Metody využívané pro úlohu deinterleavingu lze rozdělit dle počtu parametrů používaných pro separaci a to na jednoparametrické a víceparametrické metody. Tato práce se zabývá metodami především víceparametrickými. Jako vhodné metody pro autonomní jednokanálový deinterleaving byly vybrány DBSCAN algoritmus a variační bayesovské metody. Vybrané metody byly upraveny pro úlohu deinterleavingu a implementovány v programovacím jazyce Python. Jejich účinnost byla ověřena na simulovaných datech a datech z reálného provozu.
Rozpoznávání pozic a gest
Jiřík, Leoš ; Hradiš, Michal (oponent) ; Zemčík, Pavel (vedoucí práce)
Práce se zabývá studiem současného stavu v problematice zpracování obrazu, zvláště s ohledem k rozpoznávání gest. Zmiňuje vybrané postupy jiných autorů a podrobuje je kritickému pohledu. V druhé části se věnuje návrhu algoritmu, který by umožnil spolehlivé rozpoznávání gest v datech z projektů AMI a M4. Navrhují se prostředky zpřesnění informace o poloze účastníků a zpracování dynamických dat za účelem jejich přípravy k rozpoznávání. Je navržena možnost rozpoznávání gest pomocí směsi Gaussových funkcí a analýzy periodičnosti. Zkoumaná třída gest jsou gesta podporující řeč účastníka záznamu. Poslední část demonstruje výsledky a diskutuje další možný postup.
Autonomní jednokanálový deinterleaving
Tomešová, Tereza ; Žák, Libor (oponent) ; Hübnerová, Zuzana (vedoucí práce)
Tato práce se zabývá autonomním jednokanálovým deinterleavingem. Autonomní jednokánálový deinterleaving je proces separace přijaté sekvence radiolokačních impulzů od více emiterů na sekvence od jednotlivých emiterů, který jep rováděn bez lidské pomoci. Metody využívané pro úlohu deinterleavingu lze rozdělit dle počtu parametrů používaných pro separaci a to na jednoparametrické a víceparametrické metody. Tato práce se zabývá metodami především víceparametrickými. Jako vhodné metody pro autonomní jednokanálový deinterleaving byly vybrány DBSCAN algoritmus a variační bayesovské metody. Vybrané metody byly upraveny pro úlohu deinterleavingu a implementovány v programovacím jazyce Python. Jejich účinnost byla ověřena na simulovaných datech a datech z reálného provozu.

Národní úložiště šedé literatury : Nalezeno 19 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.